正则表达式的问题>

来源:百度知道 编辑:UC知道 时间:2024/07/14 23:28:58
tr>
<td align="left" class="title02">公司简介</td>
</tr>
<tr>
<td class="htr"></td>
</tr>
<tr>
<td>东莞市华瑞实业投资有限公司是由华坚鞋业国际(BIV)股份有限公司(香港裕元集团占股50%)与香港保威集团,于2007年合资组建,是专业从事鞋业产业园区投资开发建设的现代化新型企业。<br> 本公司拥有雄厚的国际鞋业贸易品牌研发物流服务项目——世界鞋业(亚洲)总部基地。<br> 该项目被东莞市厚街镇政府定为2008年“十大重点经济建设项目”之一,并获得东莞市、镇两级政府的多方支持。项目总占地面积14万平方米,总建筑面国际鞋业物流仓储配送中心心”。<br> 为此,我们已和国内外多个知名专业团队一起合作,以实现在规划设计、建筑设计、景观设、有团队合作精神的有志之士加盟本公司,<br> 伴巨人成长,创造企业辉煌;<br> 与巨人同行,实现共同理想 。</td>
</tr>

以下为正则表达式:
<tr><td align="left" class="title02">公司简介</td></tr></tr><td class="htr"></td></tr><tr><td>(?<result>[^<]*?)</td>
但是有错误,大家指点一下啊!
我要对(东莞市,到实现理想这一段话进行匹配)
这个公司简介,将内容匹配下来!

<result>是什么不明白
var reg = /(<\/?\w*>)/gim ;
只匹配掉HTML标签,具体内容replace(reg,'')

你瞎写的什么

应该是CMS系统里的采集功能吧,具体是那个系统得说明白,你这样没法解答,此题无解..............

你瞎写的什么

string kcontent = @"(?s)<td>(.*?)</td>";
string varcontent = Regex.Match(你抓来的网页源码, kcontent).Groups[1].Value;

//获取某一网页url的源代码
public string GetHtml(string htmlUri)
{
WebClient client = new WebClient();
Uri uri = new Uri(htmlUri);
return client.DownloadString(uri);
}

string regexExp = @"^<td>(?<result>东莞市.*共同理想 。)</td>$";
string result = Regex.Match(GetHtml(url), regexExp).Groups[1].Value;